Pengumpulan Data
👩🏫 Secara Formal:
Analisis data merupakan proses yang melibatkan penggunaan metode dan teknik tertentu untuk memahami pola dan faktor yang akan dianalisis. Proses ini mencakup tentang pengolahan awal sumber data yang tersedia, termasuk menghilangkan nilai atau data yang tidak valid.
Pengumpulan data melibatkan pemahaman tentang berbagai teknik untuk mengumpulkan informasi yang diperlukan. Data permasalahan lingkungan dapat diperoleh dari situs resmi seperti BPS, KLHK (menlhk.go.id), BMKG, atau BRG.
Analogi Jaman Now
"Bayangin kamu lagi mau belanja online untuk cari sepatu incaran. Kamu pasti ngumpulin data dulu kan? Cek harga di Shopee, Tokopedia, liat review di TikTok, dll. Nah, kalau datanya udah dapet (Pengumpulan Data), kamu sortir mana toko yang ratingnya bagus dan harganya masuk akal (Analisis Data). Gak mungkin kan asal klik beli tanpa riset dulu?"
Tren Deforestasi Indonesia
Berdasarkan data KLHK, angka deforestasi Indonesia menunjukkan tren naik turun. Puncak deforestasi terjadi pada periode tertentu. Coba tebak kapan puncak deforestasi dalam rentang 2014-2020? Klik kotak di bawah untuk melihat datanya!
Google Colab & Pandas
👩🏫 Secara Formal:
Setelah melakukan pengumpulan data, langkah selanjutnya adalah import data ke dalam Python. Python memungkinkan pengelolaan data yang besar secara lebih efisien daripada Microsoft Excel.
Untuk memudahkan proses tanpa perlu instalasi aplikasi berat seperti Anaconda di laptopmu, kita akan menggunakan Google Colab. Google Colab adalah Jupyter Notebook environment yang berjalan sepenuhnya di *cloud* (browser), gratis, dan sudah terinstal berbagai library Data Science seperti pandas, numpy, dan matplotlib.
Analogi Jaman Now
"Main Python di Anaconda itu ibarat kamu harus download game bergiga-giga ke laptop kamu, bikin lemot dan ribet settingnya. Kalau pakai Google Colab, itu ibarat Cloud Gaming! Kamu cuma butuh browser dan internet, gamenya jalan di server Google yang super canggih. Gak perlu install apa-apa, tinggal buka link dan langsung ngoding!"
Langkah-langkah Import Data di Google Colab:
Buka Google Colab
Buka browser kamu dan akses colab.research.google.com. Pastikan kamu sudah login akun Google. Klik "New Notebook" (Notebook Baru).
Upload File CSV
Di sidebar sebelah kiri, klik ikon (Files). Klik ikon panah ke atas (Upload) dan pilih file deforestasi.csv dari laptopmu.
Tulis Kode Import Library & Data
Ketikkan kode berikut di dalam cell, lalu klik tombol Play (Run cell) di sebelah kirinya:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# Membaca file CSV
data = pd.read_csv('deforestasi.csv', sep=';')
print(data.head())
Visualisasi Data dengan Python
👩🏫 Secara Formal:
Visualisasi data mencakup prinsip kesederhanaan, ketepatan, kejelasan, dan konsistensi. Hal ini dilakukan untuk mengubah data mentah berbentuk angka (tabel) menjadi representasi grafis (seperti grafik batang atau pie chart) agar insight dan pola data lebih mudah dipahami oleh audiens.
Di Python, matplotlib.pyplot adalah pustaka standar yang sangat kuat untuk membuat berbagai jenis grafik statis, animasi, maupun interaktif.
Contoh Hasil Visualisasi (Deforestasi 2019-2020)
Arahkan kursor ke grafik batang untuk melihat nama provinsi. Papua mencatat angka tertinggi pada 2019-2020.
Script Python (Matplotlib)
Berikut adalah script untuk menghasilkan grafik di atas pada Google Colab. Salin dan jalankan di cell baru!
import matplotlib.pyplot as plt
# Pilih kolom tahun
col_name = 'total_2019_2020'
years = data.columns[-1:].tolist()
# Membuat figur grafik
plt.figure(figsize=(12, 8))
# Plot bar chart
bars = plt.bar(data['provinsi'], data[years].sum(axis=1), color='#10b981')
plt.xlabel('Provinsi')
plt.ylabel('Total 2019-2020 (Hektare)')
plt.title('Total Deforestasi 2019-2020 per Provinsi')
plt.xticks(rotation=90) # Memiringkan teks nama provinsi
plt.tight_layout()
plt.show()
Tugas Akhir Projek
Aktivitas Kelompok: Visualisasi & Laporan
Setelah menguasai Pandas dan Matplotlib di Google Colab, kini saatnya kalian mempraktikkan secara langsung! Bentuklah kelompok (3-4 orang).
- Cari dataset dari BPS atau Global Forest Watch tentang deforestasi wilayah tertentu (misal: Sumatera/Kalimantan).
- Upload ke Google Colab, bersihkan data, dan visualisasikan.
- Buat poster infografik hasil visualisasi menggunakan Canva/Photoshop.
- Susun laporan tugas akhir yang berisi: Pendahuluan, Metodologi, Hasil Analisis, Kesimpulan, dan Lampiran Visualisasi.
Question Card
Mengapa visualisasi data lebih disarankan menggunakan grafik batang (Bar Chart) dibandingkan tabel angka biasa ketika kita ingin membandingkan data deforestasi antar provinsi?
Jawaban: Karena otak manusia lebih cepat memproses informasi visual (seperti panjang batang) dibandingkan harus membaca dan mengurutkan angka satu per satu dari tabel. Dengan grafik batang, kita dapat langsung melihat provinsi mana yang memiliki batang tertinggi (deforestasi terbesar) secara instan.
Modul 2 Selesai!
Kerja bagus! Kamu telah menyelesaikan materi Analisis Data. Sekarang, uji pemahamanmu melalui kuis interaktif.